现代化数据资产管理,打开企业数据文化宝藏的钥匙
The following article is from 数据老铁匠 Author 张彦龙001
"去年,我们计划通过数据分析带来3千万美元的收入,到去年底,事实上我们做到了1.05亿美元" -- Hilton CDO
"如果没有数据,那你顶多算是一个持有不同观点的人而已。我们相信上帝,除此之外,都请用数据说话" -- W.Edwards Deming,质量管理之父。
"我们会收集所有数据,即使我们现在还不知道该怎么使用它!"-- 贝索斯,Amazon CEO
什么是数据民主化,为什么它很重要?
企业内,要实现数字化转型的话,塑造企业数据文化是当务之急。数据的民主化,就是为了让数据大众化,让所有用户都可以平等的接触和使用数据,如:
财务分析、HR 人力资源分析、运营分析
数据科学家进行的数据洞察
所谓”旧时王谢堂前燕,飞入寻常百姓家“。要实现数据民主化,必须极大的降低数据门槛,让本来只有IT专家可以做的事情,变的简单:让那些需要数据的人,都可以自助的发现、收集、并分析数据。
这是大数据最好的时代,这也是大数据最差的时代
多年摸爬滚打后,我们才逐渐认识到,基于事实的、数据驱动文化对一家公司是何等重要!
在这个基础上,数据在逐步的资产化,并在向货币化演进。这么一个不争的事实被认可了:随意丢弃过时的旧数据,曾经是多么错误的决定。
数据可以帮助我们发现反直觉的真相、找出生产链中低效的环节、发展潜在的商机。目前,数据已经是企业控制成本、提升利润,向精益运营转型的重要手段
大数据已经是大势所趋,不可逆转的潮流。然而,如何真正实现洪流落地、赋能商业,面临的挑战却也是前所未有的:
数据安全与个人隐私如何解决?
企业发展多年,数据孤立严重,如何找到并唤醒这些数据?
打通数据孤岛后,部门之间利益如何重新平衡?
企业内数据文化如何培养?
这些问题,个个都是致命的要害,任何一个,都可以让你的公司退变成数据荒漠。
一个数据公民的工作桌面
下图,是一个普通数据分析师或数据科学家的工具箱,和日常工作的一部分:
从数据准备、数据建模、到数据训练各个环节,数据科学家们已经装备了十八般武器,从python到Tableau。在我们的心目中,他们的形象,是这样的:
膜拜啊...我也要变成数据科学家......
且慢!请君留步!我们换个角度,再看看数据科学家的日常是如何工作的:
从数据流向的角度来看,科学家处在中下游,要想拿十八般兵器开练,还需要原料的支持,那就是数据。
而数据从生产系统生成、到采集、入湖、清洗、建仓,这些环节,都是数据科学家鞭长莫及的。
我们发现,数据科学家们欠缺的不是工具,而是数据,如何高效、方便、安全的获取数据,才是他们的痛中之痛:
数据科学之殇
再精良的装备,也无奈糟糕的数据。我们在一丝不苟的做着数据分析和数据挖掘,若数据没有保障的话,又有谁敢说我们做的不是一件"garbage in garbage out"的事呢?
从数据这个角度出发,从数据查找、理解数据、到分析数据,每一步都像是在迷宫里探索,运气好,才能撞出去...
如何破解数据科学之殇-数据迷宫呢?答案就是引入现代化的Data Catalog
现代化的Data Catalog
我们从数据分析师的例子讲开。从有想法、到数据验证的整个周期内,寻找合适数据、理解数据、信任数据、使用数据这四个环节的耗时分布大致如下:
令人惊奇的是,这四个阶段上耗费的时间,呈漏斗状分布。我们仅用了几个小时去分析数据,但是却用了数天、甚至数周去寻找这些数据!这也从侧面印证了我们之前的论断:分析工具集已经不是数据公民们最薄弱的环节。
现代化的Data Catalog需要和其他数据工具一样,作为数据科学家工作桌面上的必备选项之一
为什么要强调是现代化的Data Catalog呢?主要还是从目标出发,传统的数据目录工具已经不少,但都无法很好的解决发现和理解数据的问题,因为:
传统Data Catalog是从管理的角度来归集数据的
传统Data Catalog的目标不是数据民主化,不是为了赋予数据公民平等的使用权
现代化的Data Catalog则不同,主要是:
现代化的Data Catalog以人为中心,人才是数据资产的核心,治理数据的最终目的是理顺人与人之间的关系
从数据治理的角度,现代化的Data Catalog,认为数据是活的,数据之间的关系、数据与人之间的关系与数据本身同等重要,这是大数据的本质
通过人-人、人-数据、人-知识、数据-数据之间的关系,可以把整个公司的数据资产构建成知识图谱。
通过关系,把数据、人、知识、之间的关系构建起来,它是数据资产间流通的血液,这个基于关系打造的图谱,就是现代化Data Catalog的核心引擎。
现代化的Data Catalog可以做什么?
新入职的员工
新入职的员工,急需了解公司的数据全貌和某领域细节,现代化的Data Catalog需要提供关联的专题导引:
可快速与最合适的人交流
相信数据分析师们都不会反对这个结论:向懂的人请教一分钟,可以节省自己一整天的时间。关键是如何找到最懂的人?
通过现代化Data Catalog的核心图谱引擎,我们可以还原出:
是谁生产的这份数据,找到数据负责人
都有哪些人使用过这份数据,是在什么时候,以及都是怎么用的,从而找到数据专家
然后,通过内置接口,当场唤起沟通工具进行交流:
问答社区,内容全员可见,方便全员协作
IM,定向交流,可快速解决问题
知识库,查看专家留下的宝贵经验。知识库可以通过智能问答机器人提供更具引导性的建议。
别人对这份数据的态度
“随大流 不挨揍”, 话糙理不糙。在大数据时代,就不要做少数派啦....
在使用一份数据之前,看看是不是有其他人用过,以及反馈如何,是省时省力的方法。现代化的Data Catalog需要提供这方面的支持。
我们可以通过反馈、备注、聊天记录、知识库、TAG、FLAG等不同方式,把用户在这份数据上的行为和体验沉淀下来,这就是这份数据的画像。
数据复用
有现成的,谁不用啊!在大数据领域更是如此,因为分析师们周而复始的、重复类似的数据需求,现代化的Data Catalog不仅需要支持经验的沉淀,更需要支持结果的直接复用!
众包模式
独乐乐,不如众乐乐。数据负责人,就是有三头六臂,也没有办法完善所有的数据描述。现代化的Data Catalog需要引入众包模式,根据实际经验来完善数据描述、使用案例等。
这个特性,是与传统Data Catalog理念明显不同之一。我们没有站在管理的角度,而是相信公民都是贡献者,强调了索取与奉献共存。
写在最后
值得留意的是,你的工具箱中,不缺少数据分析和加工的利器,即使缺少这类工具,你一眼就能识别出来。
(欢迎加入数据工匠知识星球获取更多资讯)
联系我们
扫描二维码关注我们
微信:DaasCai
邮箱:ccjiu@163.com
QQ:3365722008
热门文章
数据资产顶层架构设计实践与思考
关于区块链在数据资产全生命周期管理中应用问题的探讨
【译文】数据价值及其资产化
数据资产价值管理之道
数据中台演进四个阶段和具备的三个能力
我们的使命:发展数据治理行业、普及数据治理知识、改变企业数据管理现状、提高企业数据质量、推动企业走进大数据时代。
我们的愿景:打造数据治理专家、数据治理平台、数据治理生态圈。
我们的价值观:凝聚行业力量、打造数据治理全链条平台、改变数据治理生态圈。
了解更多精彩内容
长按,识别二维码,关注我们吧!
数据工匠俱乐部
微信号:zgsjgjjlb
专注数据治理,推动大数据发展。